Chargement des librairies

Chargement des données brutes

Représentation des données

Tranformation des données en log2

Tableau de moyenne des échantillons et buckets pour NOESY
nb_ech moy median min max
Echantillon 846 0.0066202 0.0065891 0.0059730 0.0090406
Bucket 215 0.0066202 0.0026412 0.0000208 0.2255073

Etapes de Standardisation des données

standardisation par la médiane et mise à l’échelle par la plage inter-quartile

ACP via factominer

Poids des axes

Les 2 premiers axes expliquent plus de 46% de la variance exprimée.

Dendrogram

Plot

Quelque soit le groupe étudié (sexe, âge, tabac), sur les axes 1 et 2, les différents points se superposent, il n’est donc pas possible de distinguer un groupe d’un autre.

Sexe

Age

Tabac

Axe 3_4





Cercle des correlations

Biplot

Contribution des 20 buckets qui contribuent le plus à la variance expliquée.
Cette contribution est entre 0.8 et 0.9

PCA issu du Package mixOmics

Juste pour montrer le code mais les résultats sont identiques. Remarque : Chaque axe est symétrique donc qu’un individu soit à-20ici et +20 avec factominer revient au même

Sparse PCA

Regarde si on peut observer naturellement une clusterisation en fonction d’une catégorie

Quelque soit la catégorie sexe, age tabac, nous n’observons aucune clusterisation.

Sparse PLS

Clusturisation par PLS-DA structure de correlation entre CPMG and NOESY variables séléctionné sur la composante 1

Cluster_CPMG_NOESY

Cluster_CPMG_NOESY

PLS-DA

Plot

Sexe

Age

Tabac

Cercle de correlation PLS-DA

Ne sont représentés uniquement les buckets qui contribuent à au moins 50%

Test de prédiction

Possibilité de faire de la prédiction dans le cas ou les ind seraient en sous groupes, ce qui n’est pas notre cas.
ceci est juste un test mais pourrait être interressant afin de prédire une variable à partir de 100aines que nous avons

Sexe

Tabac

Age

Contribution des variables PLS-DA

Les variables sélectionnées pour la composante 1 sont exprimées de manière positives pour le sexe1 et négative pour le sexe2.
Pour l’âge : la composante est positive pour les tranches d’âge de 50 à 69et négative pour les 20-29 ans.
Pour le statut tabagique la composante est exclusivement négatives pour le statut non et ex fumeur et positif pour les fumeurs.

Sexe

Age

Tabac

Chez les fumeurs la contribution des variables a un effet positif alors qu’elle est négative dans les 2 autres catégories.

Sparse PLS-DA

Résultats simlaires à la PLSDA

Graphs

Cercle de correlation

Représentation par sexe uniquement
Ne sont représentés uniquement les buckets qui contribuent à au moins 50%

Contribution Sparse PLS-DA

Représentation des 10 premières contributions